導(dǎo)讀:對于百度搜索引擎來說,蜘蛛黑洞特指網(wǎng)站通過極低的成本制造出大量參數(shù)過多,及內(nèi)容雷同但具體參數(shù)不同的動態(tài)URL ,就像一個無限循環(huán)的“黑洞”將spider困住,Baiduspider浪費(fèi)了大
發(fā)表日期:2019-06-05
文章編輯:興田科技
瀏覽次數(shù):12834
標(biāo)簽:
對于百度搜索引擎來說,蜘蛛黑洞特指網(wǎng)站通過極低的成本制造出大量參數(shù)過多,及內(nèi)容雷同但具體參數(shù)不同的動態(tài)URL ,就像一個無限循環(huán)的“黑洞”將spider困住,Baiduspider浪費(fèi)了大量資源抓取的卻是無效網(wǎng)頁。
比如很多網(wǎng)站都有篩選功能,通過篩選功能產(chǎn)生的網(wǎng)頁經(jīng)常會被搜索引擎大量抓取,而這其中很大一部分檢索價值不高,如“500-1000之間價格的租房”,首先網(wǎng)站(包括現(xiàn)實中)上基本沒有相關(guān)資源,其次站內(nèi)用戶和搜索引擎用戶都沒有這種檢索習(xí)慣。這種網(wǎng)頁被搜索引擎大量抓取,只能是占用網(wǎng)站寶貴的抓取配額。那么該如何避免這種情況呢?
我們以北京某團(tuán)購網(wǎng)站為例,看看該網(wǎng)站是如何利用robots巧妙避免這種蜘蛛黑洞的:
對于普通的篩選結(jié)果頁,該網(wǎng)站選擇使用靜態(tài)鏈接,如:http://bj.XXXXX.com/category/zizhucan/weigongcun
同樣是條件篩選結(jié)果頁,當(dāng)用戶選擇不同排序條件后,會生成帶有不同參數(shù)的動態(tài)鏈接,而且即使是同一種排序條件(如:都是按銷量降序排列),生成的參數(shù)也都是不同的。如:http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek
http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c
對于該團(tuán)購網(wǎng)來說,只讓搜索引擎抓取篩選結(jié)果頁就可以了,而各種帶參數(shù)的結(jié)果排序頁面則通過robots規(guī)則拒絕提供給搜索引擎。
robots.txt的文件用法中有這樣一條規(guī)則:Disallow: /*?* ,即禁止搜索引擎訪問網(wǎng)站中所有的動態(tài)頁面。該網(wǎng)站恰是通過這種方式,對Baiduspider優(yōu)先展示高質(zhì)量頁面、屏蔽了低質(zhì)量頁面,為Baiduspider提供了更友好的網(wǎng)站結(jié)構(gòu),避免了黑洞的形成。
上一篇:
暫無信息更多新聞
2020
關(guān)于網(wǎng)站建設(shè),總有很多人問我百度怎么了?有什么變化,為什么不更新等等諸如此類的問題。不論是否百度做過算法調(diào)整,或許只要因為某些事情百度不更新,也會有
View details
2020
關(guān)于網(wǎng)站建設(shè),當(dāng)搜索引擎的算法改變或者加強(qiáng)時,導(dǎo)致一些網(wǎng)站的某些關(guān)鍵字排名消失,一些管理員就說他們的網(wǎng)站消失了。實際上并非如此,在搜索引擎算法改變
View details
2020
關(guān)于網(wǎng)站建設(shè),一個與企業(yè)名稱和形象相符的域名,是企業(yè)進(jìn)行網(wǎng)絡(luò)營銷的前提。由于域名具有惟一性,一個域名一旦注冊成功,任何其他機(jī)構(gòu)都無法注冊相同的域名
View details
2020
關(guān)于網(wǎng)站建設(shè),企業(yè)網(wǎng)站的作用更類似于企業(yè)在報紙和電視上所做的宣傳企業(yè)本身及品牌的廣告。不同之處在于企業(yè)網(wǎng)站容量更大,企業(yè)可以把任何想讓客戶及公
View details